دستاورد بزرگ گوگل در هوش مصنوعی با شکست بازیکن شناخته شده‌ی بازی GO

در سال‌های اخیر متخصصان امر هوش مصنوعی موفق به توسعه‌ی سیستم‌هایی شده‌اند که می‌تواند در اغلب بازی‌های فکری صورت گرفته، انسان‌ها را مغلوب کند. برای مثال می‌توان به شطرنج، Scrablle و Othello اشاره کرد. اما تاکنون هیچ یک از سیستم‌های هوش مصنوعی موفق نشده بود تا بر بهترین بازیکنان این بازی که قدمتی بیش از ۲۵۰۰ سال دارد، غلبه کند. شاید از خود بپرسید که چرا دستاورد گوگل بسیار اهمیت داشته و تا این اندازه تعیین‌کننده‌ی عنوان می‌شود؟ نگاهی به بینش و پیش‌بینی کارشناسان حوزه‌ی هوش مصنوعی، دلیلی منطقی بر اهمیت موفقیت هوش مصنوعی گوگل در غلبه بر بهترین بازیکن گو باشد. براساس گمانه زنی‌های کارشناسان در این حوزه، پیش‌بینی شده بود که برای غلبه‌ی ماشین بر بازیکنان گو، باید یک دهه‌ی دیگر به انتظار بنشینیم.

رمی کولوم، محقق فرانسوی که یکی از توسعه‌دهندگان قوی‌ترین هوش مصنوعی بازی گو است، در این خصوص چنین اظهار نظر کرده است:

گوگل بسیار زودتر از آن که انتظار آن را داشتم، به این مهم دست یافته است.

محققان در DeepMind که در سال ۲۰۱۴ توسط گوگل خریداری شده، سیستم خود را که قادر است در برابر عوامل انسانی به رقابت بپردازد، در ماه اکتبر در جریان رقابتی که در دفتر گوگل در لندن برگزار شد، به ورطه‌ی آزمایش گذاشتند. سیستم DeepMind که AlphaGo نام دارد، در برابر فان هوی، قهرمان گو در اروپا به رقابت پرداخت و موفق شد پنج مسابقه‌ی متوالی را از قهرمان اروپا برده و به نفع خود به پایان ببرد. این رقابت توسط یک خبرنگار از نشریه‌ی Nature و یکی از مسئولان فدراسیون گو در برتانیا نظارت شده است.

دکتر تانگوی چوارد، از مجله‌ی نیچر در این خصوص چنین اظهار نظر کرده است:

رقابت و برد هوش مصنوعی گوگل در رقابت با قرمان گو در اروپا را باید یکی از هیجان‌ انگیزترین لحظات در زندگی خود به عنوان یک محقق و خبرنگار عنوان کنم.

آلفاگو علاوه بر آموزش با ۳۰ میلیون حرکت انجام شده در بازی گو، از تقابل با خود نیز نکات جدیدی را یاد می‌گیرد

نیچر با انتشار مقاله‌ای به تشریح هوش مصنوعی آلفا گوی گوگل پرداخته است. براساس اطلاعات ارائه شده، غول جستجو در این سیستم هوش مصنوعی از فناوری یادگیری عمیق (Deep Learning) استفاده کرده است. محققان گو در مقایسه با سایر سیستم‌های هوش مصنوعی توسعه یافته در این رابطه، اقدام به استفاده از روش هوشمندانه‌تری کرده‌اند. محققان گوگل مجموعه‌ای از حرکت‌های بهترین بازکنان گو را که شامل بیش از ۳۰ میلیون حرکت است، جمع آوری کرده و سیستم هوش مصنوعی مبتنی بر یادگیری عمیق خود را با استفاده از این حرکات آموزش داده‌اند تا از این طریق آلفاگو قادر باشد به تنهایی و براساس تصمیمات خود به بازی بپردازد. اما این مرحله را باید قدم اول در مسیر توسعه‌ی یک سیستم هوش مصنوعی خوب خواند که توانایی آن برابر با بهترین بازیکنان گو است. دانشمندان برای بهبود هر چه بیشتر این سیستم، تدبیر هوشمندانه‌ای را در پیش گرفتند. راه‌حل تقابل هوش مصنوعی توسعه یافته با خودش بود؛ با استفاده از این روش، دانشمندان موفق شدند تا حرکات جدیدی را نیز ثبت کنند و با استفاده از این حرکات آموزش هوش مصنوعی را وارد مرحله‌ی جدید‌تری نمایند. چنین سیستمی قادر شده تا بهترین بازیکن اروپا را شکست دهد.

دمیس هاسابیس، یکی از ناظران توسعه‌ی DeepMind در این خصوص چنین اظهار نظر کرده است:

بزرگ‌ترین نتیجه‌ی توسعه‌ی آلفاگو، عدم توسعه‌ی این سیستم با قوانین از پیش تعیین شده است. در عوض این سیستم از روش‌های مبتنی بر یادگیری ماشین توسعه یافته و تکنیک‌های برد در بازی گو را به خوبی یاد گرفته است.

اما چرا این برد یک دستاورد بزرگ است؟ آیا این دامنه‌ی این برد فقط به بازی گو محدود می‌شود؟ به طور حتم پاسخ این سوال منفی است. کمپانی‌هایی نظیر گوگل، مایکروسافت و فیس بوک که سرویس‌های آنلاین را در اختیار کاربرانشان قرار می‌دهند، از یادگیری عمیق برای تشخیص تصاویر و سوژه‌های موجود در آن، شناسایی کلمات ادا شده و درک زبان طبیعی مورد تکلم استفاده می‌کنند. تکنیک مورد استفاده در آلفاگو ترکیبی از یادگیری عمیق و روشی است که اصطلاحا از آن با عنوان یادگیری تقویت شده نام برده می‌شود. چنین تکنیکی می‌تواند در آینده روش تعامل روبات‌ها با محیط اطراف و درک و پاسخگویی به تحولات پیرامون را در اختیار این موجودات ساخت دست بشر قرار دهد.

هاسابیس می‌گوید:

این روش می‌تواند یک ویژگی طبیعی برای ربات‌ها باشد.

هاسابیس همچنین معتقد است که با استفاده از این روش پیشرفت در زمینه‌ی هوش مصنوعی بیش از پیش شتاب خواهد گرفت. وی مطالعه در هوش مصنوعی را برای یافته‌هایی با کاربردهایی دیگر بسیار مثمر ثمر خوانده است. وی در این خصوص می‌گوید:

با استفاده از این تکنیک می‌توان سیستم‌هایی را توسعه داد که قادرند میزان داده‌ی بسیار بزرگ‌تری را مورد بررسی قرار داده و همچنین بسیار بهتر از متخصصان در زمینه‌های گوناگون به تحلیل و بررسی مسائل بپردازند. این سیستم‌ها هم از نظر عملکرد و هم از نظر بهینگی بسیار بهتر عمل خواهند کرد؛ بطوریکه شاید این سیستم‌ها راهکارهایی را پیشنهاد دهند که حتی به ذهن متخصصان حوزه‌ی مورد نظر خطور نکرده است.

البته در حال حاضر بازی گو اولین دغدغه‌ی ذهنی هاسابیس و همکارانش است. براساس اطلاعات ارائه شده وی در نظر دارد تا پس از شکست قهرمان اروپا در پشت درهای بسته، به سراغ یکی دیگر از بزرگ‌ترین بازیکنان جهانی رفته و با وی در یک رویارویی عمومی به رقابت بپردازند. شنیده‌ها حکایت از این دارد که آلفاگو در میانه‌های ماه مارس در کره‌ی جنوبی با لی سدول، یکی از بازیکنان گو که در عرصه‌ی بین المللی دارای عناوین بسیاری است، به رقابت خواهد پرداخت. به گفته‌ی هاسابیس، لی سدول را باید راجر فدرر دنیای گو بدانیم.

آلفاگو چگونه خود را آموزش می‌دهد؟

در ابتدای سال ۲۰۱۴ میلادی، برنامه‌ی هوش مصنوعی Coulom که Crazystone نام داشت موفق شد در برابر نوریموتو یودا، بازیکن قهار این رشته‌ی ورزشی پیروز شود؛ اما موضوعی که باید در این پیروزی اشاره کرد، انجام ۴ حرکت پی در پی ابتدایی در این رقابت توسط برنامه‌ی هوش مصنوعی توسعه یافته بود که برتری بزرگی در بازی گو به شمار می‌رود. در آن زمان Coulom پیش‌بینی کرده بود که برای غلبه بر انسان، نیاز به یک بازه‌ی زمانی یک دهه‌ای است تا ماشین‌ها بتوانند پیروز رقابت با انسان‌ها در بازی گو باشند.

در بازی شطرنج در هر دور تنها بصورت میانگین ۳۸ احتمال برای حرکت بعدی وجود دارد؛ در حالی که در بازی گو در هر دور بیش از ۲۵۰ احتمال وجود دارد

چالش اصلی در رقابت با بهترین بازیکن‌های گو، در طبیعت این بازی نهفته است. حتی بهترین ابررایانه‌های توسعه یافته نیز برای آنالیز و پیش‌بینی نتیجه‌ی حرکت‌های قابل انجام از نظر قدرت پردازشی دچار تزلرل شده و نمی‌توانند قدرت پردازشی مورد نیاز را تامین کنند. در واقع نیروی پردازشی این رایانه‌ها مناسب نبوده و در نتیجه زمان درازی را برای ارائه‌ی نتیجه‌ی قابل قبول مورد نیاز است. زمانی که ابررایانه‌ی موسوم به Deep Blue که توسط IBM توسعه یافته بود، موفق شد تا در سال ۱۹۹۷، گری کاسپاروف، قهرمان شطرنج جهان را شکست دهد، بسیاری به قدرت این ابررایانه پی بردند؛ چراکه این ابررایانه با قدرت زیادی کاسپاروف را شکست داد. علت پیروزی قاطع این دیپ بلو، قدرت بالای این ابررایانه در کنار قدرت تحلیل و نتیجه‌گیری از هر حرکت احتمالی ممکن در بازی بود که تقریبا هیچ انسانی توانایی انجام آن را ندارد. اما چنین پیش‌بینی‌هایی در بازی گو ممکن نیست. براساس اطلاعات ارائه شده در بازی شطرنج، در هر دور، بصورت میانگین می‌توان ۳۵ حرکت را انجام داد، اما در بازی گو که بین دو نفر در تخته‌ای به بزرگی ۱۹ در ۱۹ خانه انجام می‌شود، در هر دور بصورت میانگین می‌توان بیش از ۲۵۰ حرکت انجام داد. هر یک از این ۲۵۰ حرکت احتمالی نیز در ادامه ۲۵۰ احتمال دیگر را در پی دارند. هاسابیس به این موضوع اشاره کرده که در بازی گو، به اندازه‌ای احتمال حرکات گسترده است که تعداد آن از اتم‌های موجود در جهان هستی نیز بیشتر است.

با استفاده از تکنیک‌‌ موسوم به درخت مونت کارلو، سیستم‌هایی نظیر CrazyStone قادرند تا احتمالات بیشتری را محاسبه کرده و چندین مرحله به سمت جلو به پیش بروند. با استفاده از این تکنیک می‌توان دامنه‌ی احتمالاتی را که باید محاسبه شوند، بسیار کاهش داد. در نهایت باید به این موضوع اشاره کرد که استفاده از این راهکار باعث می شود تا سیستم‌های مبتنی بر هوش مصنوعی بتوانند بر شماری از بهترین بازیکنان گو غلبه کنند؛ اما این شامل بهترین و باهوش‌ترین بازیکن نمی‌شود. در میان اساتید بازی گو، حرکت‌های انجام شده وابسته به تجربه است. این دسته از بازیکنان توصیه می‌کنند تا در انجام بازی به جای تحلیل هر یک از حرکت‌های ممکن، از حالت کنونی تخته برای انجام جرکت بعدی استفاده شود.

 پس از موفقیت نسبی سیستم CrazyStone در سال ۲۰۱۴ شماری از متخصصان در سال ۲۰۱۵ شامل دانشمندانی از فیس بوک، دیپ مایند و دانشگاه ادینبورگ استفاده از یادگیری عمیق را برای توسعه‌ی هوش مصنوعی به منظور رقابت در بازی گو را در دستور کار قرار دادند. هدف این محققان، شبیه سازی روند بازی اساتید بازی گو در قالب یک سیستم هوشمند بود.

در شبکه‌های عصبی سیستم در چارچوب قوانین از پیش تعیین شده تصمیم نمی‌گیرد؛ بلکه با تحلیل حجم گسترده‌ای از داده‌ها، تصمیم گیری در یک حوزه را فرا می‌گیرد

یادگیری عمیق مبتنی بر شبکه‌های عصبی است که شامل بستر نرم‌افزاری و سخت‌افزاری که تقریبا ساختاری شبیه به شبکه‌ی نورون‌های مغز انسان دارد. سیستم‌های مبتنی بر یادگیری عمیق و شبکه‌های عصبی عملکردی در چارچوب قوانین مشخص ندارند. به بیان بهتر این سیستم‌ها براساس شرایط و قوانین پیش‌بینی شده برای این شرایط تصمیم‌گیری نمی‌کنند؛ بلکه سیستم‌های مبتنی بر شبکه‌های عصبی با تحلیل حجم زیادی از اطلاعات، تلاش می‌کنند تا روند انجام یک وظیفه را به خوبی یاد بگیرند. برای مثال می‌توان با ارائه‌ی تصاویر متنابهی از یک حیوان به شبکه‌ی عصبی آماده شده برای شناسایی سوژه از تصاویر مختلف، آن را برای شناختن حیوان مشخص شده از تصاویر آموزش داد. در صورتی که یک شبکه‌ی عصبی را با دامنه‌ی لغات مناسبی آشنا کنیم، رفته رفته این سیستم یاد می‌گیرد تا آنچه را که بر زبان جاری می کنیم درک کرده و متناسب با آن به تعامل با ما بپردازد. به همین ترتیب با ارائه‌ی تعداد مناسبی از حرکت‌ها در بازی گو، این سیستم هوش مصنوعی قادر است تا خود به انجام بازی بپردازد.

محققان در دیپ مایند، دانشگاه ادینبورگ و فیس‌بوک امیدوارند تا با استفاده از شبکه‌های عصبی، سیستم‌هایی مبتنی بر شبکه‌های عصبی توسعه دهند که قادر باشد تا با نگاه کردن به تخته‌ی بازی، همچون انسان‌ها به بازی بپردازند. محققان در فیس‌بوک موفق شده‌اند تا با کنار هم قراردادن تکنیک درخت مونت کارلو و یادگیری عمیق، شماری از بازیکنان را در بازی گو شکست دهد. البته سیستم فیس‌بوک قادر به برد در برابر CrazyStone و سایر بازیکنان شناخته شده‌ی این رشته‌ی ورزشی نشد.

آلفاگو ۵۷ درصد از حرکات بعدی بازیکنان را در بازی گو به درستی پیش‌بینی می‌کند

دیپ‌مایند این ایده را بیش از پیش توسعه داد. سیستم هوشمند این کمپانی توسط ۳۰ میلیون حرکت انجام شده توسط بازیکنان قهار آموزش دیده است. براساس اطلاعات ارائه شده سیستم هوشمند دیپ‌مایند قادر است تا در بیش از ۵۷ درصد موارد حرکت بعدی بازیکنان با عوامل انسانی را پیش‌بینی کند. رکورد پیشین این سیستم ۴۴ درصد بود. پس از آموزش شبکه‌ی عصبی آلفاگو توسط حرکاتی که توسط انسان‌ها انجام شده، متخصصان دیپ مایند، این سیستم را در برابر نسخه‌های مختلفی از آلفاگو قرار دادند. سیستم آلفاگو در زمان نبرد در شبکه‌ی عصبی، تمام حرکت‌هایی را که بیشترین نتیجه‌ی مثبت را در پی داشته، ثبت کرده است. رفته رفته این سیستم یاد گرفته که کدام حرکت‌ها سرانجام خوبی داشته و کدامیک نمی‌تواند نتیجه‌ی درخوری را داشته باشند.

دیوید سیلور یکی از متخصصان دیپ مایند است که در این خصوص چنین اظهار نظر کرده است:

آلفاگو یاد گرفته تا استراتژی‌های جدیدی را برای بازی یاد گرفته و روش‌های خود را با رقابت با خود، بیش از پیش بهبود بخشد.

براساس اطلاعات ارائه شده توسط سیلور، آلفاگو به همین علت بسیار بهتر از سایر سیستم‌های هوش مصنوعی مشابه عمل می‌کند که از جمله‌ی آن می‌توان به CrazyStone اشاره کرد. دانشمندان در مرحله‌ی بعد نتایج تحقیقات خود را به دومین شبکه‌ی عصبی انتقال دادند. شبکه‌ی عصبی دوم نیز با استفاده از داده‌های مورد استفاده در شبکه‌ی عصبی اول، به پیش‌بینی حرکات و نتیجه‌ی آن‌ها پرداخته است. این فرایند دقیقا شبیه به روندی است که دیپ بلو در مور بازی شطرنج در پیش گرفته است؛ با این تفاوت که آلفاگو در طی فرآیند پیش‌بینی و سنجش حرکات، به یادگیری نیز پرداخته است. در واقع آلفاگو دقیقا همه‌ی حرکات را پیش‌بینی و تحلیل نمی‌کند؛ بلکه با آنالیز داده‌های موجود، فرآیند بازی را یاد می‌گیرد. همین روش باعث شده تا هوش مصنوعی بتواند بهترین بازکن گو در اروپا را شکست دهد.

سخت افزار مورد استفاده

همچون بسیاری از شبکه‌های عصبی، سیستم DeepMind نیز با استفاده از رایانه‌‌هایی که با پردازنده‌های گرافیکی قدرتمند مجهز شده‌اند، اجرا می‌شود. این پردازنده‌های گرافیکی با هدف رندر بازی‌ها و تصاویر در کنار سایر محتوای گرافیکی توسعه یافته‌‌اند؛ اما کاربرد جدیدی که پتانسیل این پردازنده‌های گرافیک را نشان می‌دهد، استفاده از آن‌ها در حوزه‌ی شبکه‌های عصبی و محاسبات مرتبط با آن است. براساس اطلاعات ارائه شده توسط هاسابیس، سیستم DeepMind قادر است روی رایانه‌ای با چند پردازنده‌ی گرافیکی نیز به خوبی کار کند؛ اما در مسابقه‌ای که آلفاگو در برابر فان هوی برگزار کرد، این سیستم مبتنی بر شبکه‌ی عصبی از وجود شبکه‌های از رایانه‌ها بهره می‌برد که شامل بیش از ۱۷۰ پردازنده‌ی گرافیکی و ۱٫۲۰۰ پردازنده‌‌ بود. این سیستم بزرگ با استفاده از آموزش‌های دیده شده و نتایج کسب شده، در برابر فان هوی، قرار گرفت.

 DeepMind از همین سیستم برای رقابت با قهرمان جهان استفاده خواهد کرد. این رقابت در کره‌ی جنوبی برگزار خواهد شد و تا زمان آغاز مسابقه نیز تیم توسعه‌دهنده همچنان روی این سیستم کار خواهند کرد.

براساس اطلاعات ارائه شده توسط Coulom، رقابت با قهرمان جهان بسیار سخت‌تر از رقابتی است که آلفاگو در برابر فان هوی انجام داد؛ با این حال Coulom حساب ویژه‌ای را روی DeppMind باز کرده است.

پیش به سوی آینده

اهمیت توسعه‌ی سیستمی نظیر آلفاگو بسیار بالاتر از برد قهرمان جهان در بازی گو است. دانشمندان می‌توانند با استفاده از دستاوردهای آلفاگو، این سیستم را در کاربردهای دیگری نظیر روباتیک، تحقیقات علمی به کار ببرند. همچنین باید به استفاده از این سیستم در زمینه‌های دیگری نظیر دستیارهای صوتی چون سیری برای انجام فعالیت‌های سرمایه‌گذاری و اقتصادی نیز اشاره کرد.

کریس نیکولسون، موسس استارت آپ Skymind که در زمینه‌ی فناوری‌های یادگیری عمیق فعالیت می‌کند، در این خصوص این چنین اظهار نظر کرده است:

از سیستم‌های مبتنی بر شبکه‌ی عصبی نظیر آلفاگو می‌توان در هر مشکل و مساله‌ای که تعیین استراتژی برای رسیدن به موفقیت اهمیت دارد، استفاده کرد. کاربردهای این فناوری می‌تواند از اقتصاد، علم یا جنگ گسترده باشد.

یکی از نکات جالبی که باید در مورد سیستم DeepMind اشاره کرد، عدم وابستگی صرف این سیستم به داده‌هایی است که توسط توسعه‌دهندگان آن در اختیارش قرار می‌گیرد. به بیان بهتر این سیستم لزوما با استفاده از داده‌های ایجاد شده توسط انسان‌ها آموزش نمی‌بیند؛ بلکه آلفاگو قادر است از نتایج کسب شده در رقابت با خود نیز نکات جدیدی را دریافت کرده و یاد بگیرد. در سال‌های گذشته بسیاری از متخصصان و صاحب نظران در حوزه‌ی فناوری در مورد توسعه‌ی چنین سیستم‌های هوشندی هشدار داده‌اند. برای مثال می‌توان به ایلان ماسک اشاره کرد که توسعه‌ی چنین سیستم‌هایی را بسیار خطرناک عنوان کرده است؛ چراکه این سیستم‌ها قادرند با تکنیک‌های مستقل یادگیری، به اندازه‌ای پیشرفت کنند که قدرت تفکری بیشتری در مقایسه با انسان‌ها به دست بیاورند.

البته چنین نگرانی‌هایی متوجه سیستم‌هایی نظیر آلفاگو نیست؛ چراکه این سیستم‌ها در کنترل توسعه‌دهندگانش بوده و بیشتر در جنبه‌هایی نظیر انجام بازی گو مورد استفاده قرار می‌گیرند. هرچند قدرت پردازشی آلفاگو هنوز به اندازه‌ی مغز انسان نیست، اما مسیری که این سیستم برای رشد طی کرده، می‌تواند تجربیات ارزشمندی را برای پیشرفت هر چه بیشتر در اختیار متخصصان قرار دهد.

گوگل به عنوان یکی از کمپانی‌های پیش‌رو در حوزه‌ی فناوری، سرمایه‌گذاری عظیمی را در زمینه‌ی توسعه‌ی سیستم‌های هوشمند مبتنی بر فناوری‌هایی نظیر یادگیری عمیق و شبکه‌های عصبی انجام داده است. حتی بخشی از سرویس‌های ارائه شده توسط این غول اینترنتی با تکیه بر توانایی سیستم‌های هوشمند این کمپانی ارائه می‌شود.

هوش مصنوعی یکی از مهم‌ترین فناوری‌هایی است که برگ برنده‌ی کمپانی‌ها و کشور‌ها در آینده خواهد بود؛ از این رو است که بزرگان دنیای فناوری سرمایه‌های عظیمی را در این حوزه صرف می‌کنند. نظر شما در این خصوص چیست؟





تاريخ : پنج شنبه 22 بهمن 1394برچسب:, | | نویسنده : مقدم |